Introduction

Étude des bâtiments de Troyes

Données

Le jeu de données « Bâtiments de Troyes Champagne Métropole » recense l’ensemble des bâtiments situés dans l’agglomération Troyes Champagne Métropole, à des fins variées telles que l’urbanisme, l’aménagement du territoire, les analyses foncières ou encore la gestion des services publics. Il a été publié en août 2024 sur la plateforme data.gouv.fr.

Ce jeu de données provient de l’unification des bases BDTOPO® et BD PARCELLAIRE® de l’IGN. Il comprend 107 946 observations, avec très peu de valeurs manquantes, ce qui en fait une base fiable et complète pour l’analyse spatiale.

Nous avons choisi ce jeu de données, car il nous semble pertinent d’étudier la répartition géographique des bâtiments dans la ville de Troyes. Afin d’enrichir notre analyse, nous avons décidé d’y associer un second jeu de données : la Base Adresse Nationale (BAN), qui recense les adresses géolocalisées des bâtiments sur l’ensemble du territoire français (nous utiliserons uniquement les adresses du département nous concernant).

Origines et format des données

La base de données bâtiments est disponible ici. Ce jeu de données a été commandé par “Troyes Champagne Métropole” et a été mise à jour dernièrement en août 2024 dans le but de regrouper les entités géographiques de la métropole troyenne. Les données proviennent elles-mêmes de deux sources différentes qui ont été fusionnées : BDTOPO® et BD PARCELLAIRE®, les deux étant produits par IGN.

  • La BD PARCELLAIRE® fournit l’information cadastrale numérique, géo-référencée et continue sur l’ensemble du territoire français. Elle est réalisée à partir de l’assemblage du plan cadastral dématérialisé. Cependant, elle n’est plus entretenue depuis 2019.
  • La BDTOPO® est maintenu depuis 2019, elle couvre de manière cohérente l’ensemble des entités géographiques et administratives du territoire national.

Et la base de données des adresses, un csv par département, est ici (adresses-10.csv que nous avons renommé adresses_aube.csv). Les données proviennent de la BAN. Ces données sont initialement destiné aux services d’urgence pour qu’ils puissent se diriger. Elle est aussi destiné au raccord aux réseaux d’énergies ou de communication ou encore pour des analyses cartographiques précises. Sa constitution est copilotée par l’ANCT, la DINUM et l’IGN.

Les liens, quant à eux sont disponibles sur ce lien. Produits aussi par IGN, c’est une base de données qui permet de lier la BAN à son environnement géographique.

Les variables

Dans notre étude, nous allons considérer 16 variables.

BATI

Nous avons sélectionné 14 variables dans le premier jeu de données.

Nom Type Description
NATURE nominal architecture du bâtiment
USAGE1 nominal utilisation du bâtiment (agricole, résidentiel, religieux…)
USAGE2 nominal (optionnel) utilisation du bâtiment
LEGER discrète structure légère ou pas
DATE_APP discrète date d’apparition/construction (pas toujours présent)
ACQU_PLANI nominal de quelle base provient l’information
NB_LOGTS discrète nombre de logements dans le bâtiment
NB_ETAGES discrète nombre d’étages du bâtiment
MAT_MURS discrète code des matériaux des murs (à croiser avec le csv materiaux_murs.csv)
MAT_TOITS discrète code des matériaux de la toiture (à croiser avec le csv materiaux_toits.csv)
HAUTEUR continue hauteur du bâtiment
Z_SOL continue altitude du sol
Z_TOIT continue altitude du toit
ETAT nominal état du bâtiment (en projet, en construction, en service, en ruine)

ADRESSES

Pour la localisation, nous utiliserons 2 variables : la longitude et la latitude.

Nom Type Description
LONGITUDE continue coordonnée GPS
LATITUDE continue coordonnée GPS

Pourquoi avoir choisi ces variables

Nous avons enlevé les variables qui nous semblaient inutiles ainsi que celles comportant peu de valeurs. Nous avons aussi enlevé les variables que nous n’avons pas trouvées pertinentes.

Plan d’analyse

1. Comment la ville de Troyes s’est étendue géographiquement au fil des années ?

Il s’agit ici de visualiser l’évolution spatiale de la ville de Troyes au fil du temps. Pour cela, nous utiliserons la variable date_app et les variables de coordonnées géographiques : latitude et longitude.

Comme types de visualisations à envisager, nous avons :

  • Une carte avec les bâtiments colorés selon leur date (période) de construction

Les problèmes potentiels :

  • l’absence de date de construction pour certains bâtiments

2. Y a-t-il un lien entre les matériaux de construction et les dates de construction ?

Il s’agit ici de déterminer s’il existe une relation entre les variables date_app, mat_murs et mat_toits. L’objectif est de vérifier si les matériaux de construction des bâtiments varient en fonction des époques.

Pour cela, nous envisageons deux types de visualisations :

  • Un line chart pour suivre l’évolution du nombre de bâtiments par matériau au fil du temps :

    • L’axe des abscisses représenterait les années
    • L’axe des ordonnées représenterait le nombre de bâtiments
    • Chaque ligne représenterait un matériau
  • Un violon plot pour étudier la distribution des dates selon chaque matériau :

    • L’axe des abscisses représenterait les années
    • L’axe des ordonnées représenterait les matériaux de construction

    Les problèmes potentiels sont :

    • un grand nombre de catégories de matériaux (risque de graphe illisible)

3. Y a-t-il une corrélation entre les matériaux de construction et la hauteur du bâtiment ?

L’objectif ici est de comprendre si l’évolution des matériaux a un impact sur la hauteur des bâtiments. Nous aimerions comparer la distribution des hauteurs en fonction des matériaux et vérifier si certains matériaux sont associés à des hauteurs spécifiques. Nous utiliserions de nouveau les variables mat_murs et mat_toits que nous mettrions en relation avec la variable hauteur.

Pour cela, nous envisageons d’utiliser :

  • Un violon plot ou box plot :
    • L’axe des abscisses représentant le type de matériau
    • L’axe des ordonnées représentant la hauteur des bâtiments

4. Existe-t-il une relation entre la localisation géographique et l’usage des bâtiments ?

L’objectif ici est de déterminer si certains types d’usage des bâtiments sont spécifiquement localisés dans certaines zones de la ville de Troyes. Pouvons-nous identifier des zones résidentielles, des zones industrielles et des zones commerciales ? Nous utiliserons les variables de coordonnées géographiques (longitude et latitude) et les variables usage1 et usage2.

Pour cela, nous envisageons :

  • Une carte avec les bâtiments colorés selon leur usage

Les problèmes potentiels :

  • il sera peut-être nécessaire de regrouper les usages

5. Y a-t-il une liaison entre la hauteur des bâtiments et leur usage ?

Il s’agit de déterminer s’il existe une relation entre la hauteur d’un bâtiment et son usage. Les variables utilisées sont : la variable hauteur et la variable usage1.

Pour cela, nous envisageons d’utiliser :

  • Un diagramme à barres empilées pour étudier la répartition des usages :
    • L’axe des abscisses représenterait les tranches de hauteur
    • L’axe des ordonnées représenterait le nombre de bâtiments
    • Chaque barre avec une répartition des usages

Exploration

Questions répartition simples

Distribution des matériaux

Hypothèses: Ces visualisations nous permettront de voir la distribution des bâtiments en fonction des matériaux utilisés pour les murs et les toits. On pourrait identifier les matériaux les plus utilisés et trouver les raisons pour les quelles ces matériaux sont aussi utilisés.

Graphe:

Pour cela, nous allons faire des barplots.

Matériaux des murs:

On utilisera les variables matériaux murs.

On constate que les matériaux les plus utilisés pour les murs sont les briques et l’aggloméré.

Matériaux des toits:

On utilisera les variables matériaux toits.

On constate que le matériau le plus utilisé pour les toits est les tuiles.

Distribution des hauteurs

L’objectif est de voir la distribution des bâtiments en fonction de la hauteur des bâtiments.

On remarque que la plupart des bâtiments ont une hauteur située entre 0 et 10m.

Distribution des dates de construction

L’objectif est de voir la distribution des bâtiments en fonction de l’année de construction.

## 
## Attachement du package : 'lubridate'
## Les objets suivants sont masqués depuis 'package:base':
## 
##     date, intersect, setdiff, union

Distribution en fonction des usages.

1. Lien entre la hauteur des bâtiments et leur usage.

Il s’agit de déterminer s’il existe une relation entre la hauteur d’un bâtiment et son usage. Les variables utilisées sont : la variable hauteur et la variable usage1.

Résultats attendus :

Nous pensons que :

  • Les bâtiments résidentiels seraient majoritairement de petite ou moyenne hauteur

  • Les bâtiments à usage commercial ou industriel pourraient être de hauteur élevée

Visualisation

Interprétation des résultats

On remarque que la plupart des bâtiments ont une hauteur inférieure à 10 m. Cela peut être lié au fait que la ville de Troyes n’a pas subi une urbanisation dense. Ensuite, on remarque que la plupart des bâtiments sont à usage résidentiel.

Contrairement à l’hypothèse de départ, la plupart des bâtiments à usage commercial ont une hauteur inférieure à 10 m. Cela s’explique par le fait que les commerces sont intégrés en rez-de-chaussée des bâtiments résidentiels.

2. Expansion de la ville de Troyes au fil du temps

Nous voulons voir si les bâtiments si les bâtiments ont été construits de plus en plus loin du centre de Troyes au fil des années ou si cela a peu d’influence.
Les variables utilisées sont : date_app, longitude et latitude.

Nous pensons que :

  • Les bâtiments dans le centre sont les plus vieux

  • Il y a des vieux bâtiments aussi autour de Troyes

Visualisation

Interprétation des résultats

Il est difficile de connaître la date de construction des bâtiments qui ont été construits avant 1600, d’où le manque d’information. J’ai dû masquer tous les bâtiments dont on a pas la date de construction car cela nuisait à la lisibilité du graphique.

On remarque la construction de beaucoup de bâtiments entre 1700 et 1800, puis une assez grosse expansion entre 1800 et 1900. On remarque aussi que l’agglomération de Troyes avait sa forme assez tôt et que même si elle s’est densifiée, elle ne s’est pas vraiment étendue.

3. Y a-t-il une corrélation entre les matériaux de construction et la hauteur du bâtiment ?

L’objectif ici est de comprendre si l’évolution des matériaux, principalement des murs a un impact sur la hauteur des bâtiments. Pour cela, nous allons réaliser deux violinplot, l’un lié au matériau des murs et l’autre des toits afin de confirmer une corrélation.

Les variables utilisées sont :

  • MAT_MURS : variable nominale : code des matériaux des murs, croisé avec materiaux_murs.csv

  • MAT_TOITS : variable nominale : code des matériaux de la toiture, croisé avec materiaux_toits.csv

  • HAUTEUR : variable continue représentant la hauteur absolue du bâtiment

Nous nous attendons à ce que les matériaux plus modernes et denses comme le béton ( au niveau des murs et aussi de la toiture ) composent les bâtiments les plus hauts de l’agglomération troyenne. De, plus nous pensons que le matériau des murs aura plus d’influence que celui de la toiture.

Visualisation

## Warning: Groups with fewer than two data points have been dropped.

Interprétation des résultats

Tout d’abord, quand l’on regarde le graphique de la hauteur par rapport aux matériaux des murs, il est difficile d’observer une corrélation. En effet, on remarque de très faibles différences dans la distribution des hauteurs pour chaque combinaison de matériau. Cela pourrait amener à penser que le matériau des murs n’a pas une influence déterminante sur la hauteur des bâtiments, du moins d’après cette visualisation. Une approche complémentaire, comme représenter la hauteur moyenne ou médiane pour chaque matériau, pourrait nous apporter des réponses plus claires et mettre en évidence des tendances qui peuvent être plus légères.

Cependant, quand l’on observe le graphique lié à la hauteur des bâtiments selon le matériau de la toiture, on peut clairement observer que les matériaux ZINC ALUMINIUM, BETON et ARDOISES recouvrent les bâtiments les plus hauts, alors que les TUILES ne dépassent que très rarement la dizaine de mètres de hauteur. Cela indique une possible corrélation entre le type de matériau utilisé pour la toiture et la hauteur des bâtiments.

En conclusion, la question est partiellement répondue et les résultats diffèrent sensiblement de nos attentes initiales. On remarque une corrélation significative entre les matériaux de toiture et la hauteur des bâtiments, alors que celle entre les matériaux des murs et la hauteur est beaucoup plus difficile à établir sans pour autant pouvoir l’écarter du champ des possibilités. Cela soulève donc une nouvelle question : pourquoi le matériau de la toiture semble-t-il mieux refléter la hauteur d’un bâtiment que celui des murs ?

4. Peut-on voir des matériaux de construction des murs de prédilection selon les époques ?

L’objectif ici est de comprendre si l’utilisation des matériaux changent salon les époques. Pour cela nous allons réaliser un violinplot lié matériau des murs.

Les variables utilisées sont :

  • MAT_MURS: variable nominal: code des matériaux des murs, croisé avec materiaux_murs.csv

  • DATE_APP: variable discrète d’apparition des bâtiments

Nous nous attendons à ce que les matériaux les plus solides de chaque époque soit utilisés successivement.

Visualisation

## Warning: Removed 51774 rows containing non-finite values (`stat_ydensity()`).

Interprétation des résultats

Tout d’abord, il faut préciser que nous manquant de beaucoup d’information, particulièrement sur les années avant 1800. Il est donc impossible de généraliser les informations du graphe. De plus, un certain nombre de bâtiments n’ont pas de matériaux connus. Nous passons donc de 107 946 observations à 59097 observations. Cependant, nous pouvons voir des tendances se dégager. Certains matériaux sont présent depuis avant 1600, comme l’aggloméré et le bois. D’autres ont connu des pics de popularité récents, comme le béton, la brique et l’aggloméré. On peut aussi remarqué l’utilisation massive de la pierre autours des années 1900 mais s’est raréfié depuis. Même si certains matériaux s’imposent à certaines époques, on peut voir qu’il y a une diversité de ceux-ci et beaucoup de mélange de matériaux.

Pour aller plus loin, on aurait pu faire le même graphique mais en ayant une distribution des matériaux par période en pourcentage, ce qui éviterait “l’écrasement” des données plus anciennes et moins nombre, mais ferait perdre du détail sur la chronologie.